一种基于WordNet上下文的词义消歧算法

一种基于WordNet上下文的词义消歧算法

作者:师大云端图书馆 时间:2021-10-30 分类:参考文献 喜欢:1217
师大云端图书馆

【摘要】在由于万维网中的知识爆炸式增长,并随着万维网快速兴起,万维网上的海量数据都是以自然语言形式存储的,例如:网页微博、各种论坛、空间、贴吧等等存储介质上,所以,关于一些知识获取、挖掘,信息传播,自然语言处理NLP等研究方向迅速火热,但是,由于存储在“介质”上的知识存在歧义性,这样使得自然语言处理的过程就变得复杂、困难,而且机器学习无法判断语言之间的歧义性。于是,词义消歧应运而生了。词义消歧是自然语言处理中一个比较重要的分支,它也是自然语言处理过程中的基础性研究,通常包含:文本处理、语言识别、机器翻译MT、信息获取IE、信息检索IR、字典查询和数据分析等领域。由于词义消歧是自然语言处理过程中的难点和重点,因为词义消歧对其他应用有着重要的理论依据和实践意义。因此,词义消歧成为了中间任务,它也成为了自然语言处理的重要过程,将其研究成果直接应用于信息处理的很多方面。词义消歧WSD(WordSenseDisambiguation)工作需要具备完备的知识推理,而目前由于获取知识匮乏导致了词义消歧后的结果导致准确率降低和覆盖率减少,这也称为是获取知识匮乏导致了瓶颈的出现,这不仅限制了词义消歧性能提升,降低了词义消歧系统的应用范围。从另一个角度讲,词义消歧也可以根据单词所在的上下文来确定该单词的具体含义,所需确定的多义词必须是该多义词所在文中的上下文之中才有可能实现的,既是一个多义词的具体含义是根据其语境确定的,而在自然语言处理过程中计算单词上下文,务必会增加时间复杂度和空间复杂度的,用于单词所在上下文进行词义消歧时直接影响词义消歧的结果。词义消歧WSD也被认为是人工智能上完备问题,这种问题将必须转化为具有结构的知识文档,再次根据系统中提供好的知识库事先定义规则确定单词词义,一种基于WordNet上下文的词义消歧WSD的关键是获取在WordNet中的知识,如果在WordNet中获取的知识越多的话,词义消歧的结果就会越理想,本文中基于WordNet上下文的词义消歧算法中实现了为歧义单词建立了语义关系图,从而为词义消歧提供了丰富并且可信的知识源,本文的算法弥补了知识获取的瓶颈问题。此外,使用WordNet作为词义消歧的唯一知识源,减少了为多义词进行词义标注的难题,这样使之词义消歧能够成功地应用到语境搜索中。基于以上问题,本文将针对如何在WordNet中获取知识和为多义词建立语义关系图作为本文的主要研究内容,由于WordNet发展至今已经有十几年的历史,在其中蕴含着丰富的知识。确定上下文的方法有三种:一是基于滑动窗口的上下文获取上下文算法;二是基于依存关系获取上下文算法;三是基于句法分析树获取上下文算法。本文的主要研究内容及成果:一是依据句法分析树获取上下文特征词的算法;分析中心词表获取上下文的特征词;根据上下文进行词义消歧。二是本文使用WordNet中多义词之间的语义关系,再结合上下文进行词义消歧。三是本文中的算法构建三种语义关系图模型,这种语义关系图模型为词义消歧提供了大量知识。本文选取实验测试集是Senseval-3作为词义消歧任务,实验结果良好。作为本文的主要研究内容,由于WordNet发展至今已经有十几年的历史,在其中蕴含着丰富的知识。确定上下文的方法有三种:一是基于滑动窗口的上下文获取上下文知识;二是基于依存关系获取上下文知识;三是基于句法分析树获取上下文知识。本文的主要研究内容及成果:一是依据句法分析树获取上下文特征词的算法;分析中心词表获取上下文的特征词;根据上下文进行词义消歧。二是本文使用WordNet中多义词之间的语义关系,再结合上下文进行词义消歧。三是本文中的算法构建三种语义关系图模型,这种语义关系图模型为词义消歧提供了大量知识。本文选取实验测试集是Senseval-3作为词义消歧任务,实验结果良好。
【作者】刘琦;
【导师】李颖;
【作者基本信息】吉林大学,软件工程,2014,硕士
【关键词】WordNet;词义消歧;语义关系;上下文;自然语言处理;

【参考文献】
[1]王琮琮.JNC集团总部员工绩效管理体系设计[D].山东大学,工商管理(专业学位),2013,硕士.
[2]魏迎辰.温阳补肾方治疗兔激素性股骨头坏死的实验研究[D].福建中医药大学,中医骨伤科学,2014,硕士.
[3]孟令智.基于路面抗滑测试结果的汽车轮胎/路面摩擦特性转换研究及仿真[D].长安大学,车辆工程,2014,硕士.
[4]成晓舟.u-PA与VEGF在胃癌中的表达及其意义[D].兰州大学,外科学,2013,硕士.
[5]向繁国.长江上游江津段德感坝河岸带植物群落结构及多样性研究[D].西南大学,水产养殖,2014,硕士.
[6]沈丹.欧洲主权债务危机对中国经济的影响及应对策略研究[D].湖南科技大学,应用经济学,2013,硕士.
[7]蔡泽祥,王星华,任晓娜.复杂网络理论及其在电力系统中的应用研究综述[J].电网技术,2012,11:114-121.
[8]石天义.用于离子选择的AC信号合成技术研究[D].哈尔滨工业大学,信息与通信工程,2013,硕士.
[9]马楠.辽宁电力中心医院PACS项目质量控制研究[D].吉林大学,工业工程,2013,硕士.
[10]朱文娟.制造商—客户关系对制造商服务化的影响[D].浙江工商大学,技术经济及管理,2014,硕士.
[11]赵湘秦.新晃县农村土地综合整治现状与对策研究[D].湖南农业大学,农业资源利用,2012,硕士.
[12]陈相光.高中生理科综合能力的现状分析及培养策略研究[D].山东师范大学,学科教学论,2003,硕士.
[13]仲小挺.基于自学习的手写表格数字字符串快速识别方法的研究[D].哈尔滨工业大学,信息与通信工程,2014,硕士.
[14]戴辰铖.便携式气相色谱仪控制系统的研究[D].哈尔滨工业大学,电子与通信工程,2013,硕士.
[15]赵岚.硝基苯污染物在河污混合过程中的迁移转化行为研究[D].华东师范大学,物理化学,2004,硕士.
[16]陈宁,刘雨田,刘波,桂卫华.具有平衡点漂移的非线性系统参数H∞控制[J].控制与决策,2013,12:1827-1830.
[17]王瑶.硅基复合锂离子电池负极材料的制备及性能研究[D].湘潭大学,2014.
[18]王若瑜.利用定点突变技术研究1-脱氧-D-木酮糖-5-磷酸合酶的关键氨基酸残基[D].西北大学,生物工程(专业学位),2014,硕士.
[19]陈新.《游仙窟》虚词研究[D].四川外国语大学,汉语言文字学,2014,硕士.
[20]郑江华.中小型软件企业项目开发过程质量管理方法研究[D].华中科技大学,工商管理,2013,硕士.
[21]胡园园,郭辉,钱俊青.应用前沿亲和色谱评价5种知母糖苷类化合物的α-淀粉酶抑制活性[J].食品科学,2014,23:99-103.
[22]张洁.动水压力对深水高墩桥梁地震响应影响的分析[D].重庆交通大学,桥梁与隧道工程,2012,硕士.
[23]黄愈.A黄金集团公司财务管控机制研究[D].北京交通大学,2014.
[24]徐欢.基于导电纳米粒子与植酸自组装制备生物传感器及其性能研究[D].上海师范大学,2012.
[25]徐小丽.视觉特征对船舶驾驶行为的影响研究[D].武汉理工大学,交通运输规划与管理,2012,硕士.
[26]陈超.不同限定条件下企业员工理性行为倾向研究[D].贵州师范大学,应用心理学,2014,硕士.
[27]梁敬芳.集团诉讼及其发展前景问题研究[D].青岛大学,诉讼法学,2013,硕士.
[28]张婷.大学生网络偏差行为与自我中心、社会支持的关系[D].赣南师范学院,发展与教育心理学,2014,硕士.
[29]倪志伟,黄玲,李锋刚,忻凌.数据流管理与挖掘研究[J].合肥工业大学学报(自然科学版),2005,09:1157-1162.
[30]彭建华.网箱养鳜对环境的影响及水体承载力研究[D].华中农业大学,水产养殖学,2001,硕士.
[31]吴玉香,杨梅,王聪.从机器人输出反馈自适应神经控制中学习[J].控制与决策,2012,11:1740-1744+1750.
[32]彭斌.100客座交通游览船[J].江苏船舶.1990(02)
[33]黄珊.大前庭导水管综合征患儿人工耳蜗植入术后调试结果的临床研究[D].青海大学,外科学,2013,硕士.
[34]李一波,胡杨,陈伟,王毅.基于自抗扰控制技术的无人机编队控制器设计[J].飞行力学.
[35]梁适春,张晓冬,林培峰,牛萌.一种混合储能光伏发电系统的功率预测算法[J].中国电力,2014,03:24-27.
[36]钟卉.浅析丘特切夫咏夜诗歌[D].华中师范大学,俄语语言文学,2014,硕士.
[37]万谦,陆建江,宋自林.正态云关联规则在气象中的应用[J].解放军理工大学学报(自然科学版),2002,04:1-4.
[38]黄晓霞,萧蕴诗.数据挖掘应用研究及展望[J].计算机辅助工程,2001,04:23-29.
[39]李楠楠.农业技术采用行为的空间分异及影响因素研究[D].西北大学,人文地理学,2014,硕士.
[40]高敏.碳会计信息披露与资本成本关系研究[D].北京交通大学,2014.
[41]张洪娟.豆科树种根部解剖结构和化学物质与结瘤的关系[D].南京林业大学,森林保护学,2004,硕士.
[42]庄园.从大学生角度对比研究中外英语教师的教学能力[D].吉林大学,外国语言学及应用语言学,2014,硕士.
[43]徐桂银.基于多孔碳材料的新型高容量锂—硫电池正极材料制备及其电化学性能[D].南京航空航天大学,2014.
[44]王斌.微波频段无源互调干扰研究[D].哈尔滨工业大学,电磁场与微波技术,2014,硕士.
[45]朱东华,荆雷,徐建国.计算机前沿技术在科技管理领域的应用研究[J].科技进步与对策,2003,09:23-25.
[46]丁伟.天扬超市进销存管理系统的设计与实现[D].电子科技大学,软件工程(专业学位),2012,硕士.
[47]聂斌.复杂多品种制造系统质量管理方法与应用研究[D].天津大学,2005.
[48]王方敏.农田节水灌溉N_2O排放测定方法的研究[D].合肥工业大学,水工结构工程,2012,硕士.
[49]郭栋.基于USB和LabVIEW的数据测控系统设计[D].杭州电子科技大学,电子与通信工程,2013,硕士.
[50]邓勇.含风电场的电力系统机组优化调度研究[D].重庆大学,电气工程,2014,硕士.

相关推荐
更多